۱ استناد به این مقاله: هاشم‌زاده محمد جواد؛ نخعی» زینب؟ مرادی مقدم» حسین (۱۳۹۲). کاربرد و تعدیل قانون 


زیف و الگوی بازو در بازشناسی واژه‌مای بازدارنده زبان فارسی با استفاده از خوشه زبانی مقالات علمی - 
یه 


درو وم مرح 


پژوهشی رشته کتابداری و اطلاع‌رسانی. پژوهش‌نامه کتابداری و اطلاع‌رسانی: )۲(۲‏ ۱۹۱-۲۰۸ 


کاربرد و تعدیل قانون زیف و الگوی آماری زو در بازشناسی واژه‌های 
بازذارنده زبان فارسی با استفاده از خوشه زبانی مقالات علمی- پژوهشی 
رشته کتابداری و اطلاع‌رسانیی 


د کترمحمد جواد هاشم زاده" 3 زینب نخعی " حسین مرادی مقدم " 
دریافت: ۱۳۹۱/۷/۲۹ پذیرش: ۱۳۹۲/۴/۴ 


هدف: شناسایی و استخراج سیاهه‌هایی نظام‌مند از واژه‌های بازدارنده به منظور استفاده در نمایه‌سازی خو دکار متن‌های فارسی 
رشته کتابداری و اطلاع‌رسانی 

روش: روش تحلیل محتوا است. جامعه پژوهش» ۵۶ مقاله بودند که ۲۰ مقاله با روش نمون هگیری تصادفی ساده انتخاب شدند. 
یافقه‌ها: از مجموع ۱۵۵۵۷ واژه موجود در متن مقالات, مطابق با آلگوی زو قبل از تعدیل واژه‌ها؛ ۱۳۶۸ و بعد از تعدیل» ۴۶۸ 
واژه؛ مطابق قانون زیف نیز قیل از تعدیل» ۲۱۷ و بعد از تعدیل» ۶۰۷ واژه به عنوان واژه بازدارنده شناعته شدند. هم‌چنین از 
مجموع ۱۹۸٩‏ واژه موجود در چکیده مقالات, مطابق با الگوی زو قبل از تعدیل واژه‌هاء ۱۴۸ و بعد از تعدیل ۱۷۳ واژه و بر 
اساس قانون زیف, قبل از تعدیل ۶۰ و بعد از تعدیل» ۱۷۸۶ واژه به عنوان واژه بازدارنده استخراج شدند. در هر دو روش رابطه 
مستفیمی بین بسامد واژءها و احتمال بازدارنده بودن آن‌ها مشاهده شد. بالاترین درصد واژه‌های بازدارنده (۳۹/۴۴ درصد) بدون 
احتساب بسامد, در متن مقالات و با کاربرد الگو یآماری زو به دست آمد. نتایج این پژوهش به افزای شکارایی» کاهش حجم 
فایل درونداد و صرفه جویی در زمان و هزینه ذعیره و بازیابی اطلاعات منجر می‌شود. 


کلید واژه‌ها: واژه‌های بازدارنده؛ بسامد واژگانی؛ قانون زیف؛ نمایه‌سازی خو دکار؛ الگو یآماری زو. 


۱ . استادیار گروه کتابداری و اطلاع‌ر سانی دانشگاه بیر جند؛ عذ.ع4.۵صهزینط(2200عطعهط 
۲ کارشناس ارشد کتابداری و اطلاع‌رسانی دانشگاه بیر جند؛ 2.0۵11216)60/2500.60190 


۳ ۳ : 
مدرس دانشگاه بیر جند» طامه.ان۱2ع0)صم1هحاع00 ۱۳۵۲۵ 


۲ پژوهش‌نامه کتابداری و اطلاع‌رسانی» دانشگاه فردوسی مشهد سال ۳ شماره ۲ پائیز و زمستان ۱۳۹۲ 


مقدمه 

در طول چند دمه گذشته و با تلاش‌های متخصصان اطلاع‌رسانی» نمایه‌سازی خود کار توانسته 
است به عنوان ابزاری برای سازماندهی و در دسترس قرار دادن حجم عظیم اطلاعات موجود یا به عبارتی 
مقابله با انفجار اطلاعات مطرح گردد که در آن کل فرایند نمایه‌سازی اعم از استخراج کلیدواژه‌ها؛ مرتب 
کردن مدخل‌ها و... توسط رایانه انجام می‌گيرد. در اين نوع نمایه‌سازی به روش‌هایی که بر فراوانی نسبی 
کلمات در متن مبتنی هستند تکیه می‌شود. تعیین واحدهای متنی و مشخص کردن حد و مرز واژه برای 
ماشین از مسائل اساسی در گزینش اصطلاحات نمایه‌ای در نمایه‌سازی خود کار است ( گیلوری» ۱۳۷۹). 
به علاوه» امکان تشخیص واژه‌های مفهومی از واژه‌های بازدارنده» در فرایند انتخاب اصطلاحات نمایه‌ای 
تأثیر بسزایی دارد. آنچه مسلم است. ماشین این امکان تشخیص را تنها از طریق تطبیق واژه‌های استخراج 
شده از متن با منتسب شده به متن با فهرستی که واژه‌های غیرمجاز (بازدارنده) " نامیده می‌شود به دست 
می‌آورد (سنجی. ۱۳۸۷). البته تعبین واژه‌های غیرمجاز کار راحتی نیست. زیرا هر واژه ممکن است در 
نظامی مجاز و در نظامی دیگر غیرمجاز تلقی شود (تیلور ؛۱۳۸۱). 

در بازیابی اطلاعات عموماً کلماتی را که به صورت مکرر در متن ظاهر می‌شوند اما به تتهایی بار 
معنایی ندارند و در ارتباط با واژه‌های دیگر معنا می‌یابند و فقط به دلیل دستوری مورد استفاده قرار می- 
گيرند واژه‌های غیرمجاز می‌نامند. شناسایی این گونه از واژه‌ها یکی از مراحل اساسی در امر سازماندهی» 
ذخیره و بازیایی اطلاعات است که کاربرد آن در رشته‌های علمی و در فرایندهای نمایه‌سازی از قبیل 
نمایه‌های کوئیک مشخص شده است. به علاوه. سیاهه بازدارنده یکک ابزار بنیادی و ضروری برای خوشه- 
بندی مدرک و تحلیل شباهت مدارک و سایر اموری که با تحلیل مدارکک سرو کار دارند» می‌باشد که 
استفاده از آن منجر به کارایی بهتر این امور می‌شود. در صورتی که این واژه‌ها قبل از فرایند نمایه‌سازی 
مدارک مشخص و فهرست آن‌ها برای کنترل به رایانه داده شود باعث صرفه‌جویی در زمان و حجم 
بایگانی‌های نمایه شده و کارایی فرایند نمایه‌سازی را پین ۳۰ تا ۵۰ درصد افزایش می‌دهد؛ هم‌چنین به 
میزان زیادی از بازیابی مدارکک نامرتبط و ریزش کاذب در جست‌وجو جلوگیری خواهد کرد (زو" و 
دیگران ۲۰۰۶). اما با وجود اين» قواعد روشنی برای ایجاد چنین فهرستی وجود ندارد و بیشتر پژوهشگران 
از روش‌های مختلف برای استخراج واژه‌های بازدارنده استفاده می کنند مانند: ۱. بسامد ؛ ۲. کارکرد 
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سال ۳ شماره ۰۲ پائیز و زمستان ۱۳۹۲ کاربرد و تعدیل قانون زیف ... ۱۹۳ 


نحوی+ ۳ کاربرد قانون زیف "؛ ۴. محاسبه نمره واژه و ۵ محاسبه آنتروپی واژه. با توجه به این که اغلب 
شیوه‌های شناسایی و استخراج واژه‌های بازدارنده بر بسامد واژگانی به عنوان بهترین و متداول‌ترین راه 
تأکید دارند و هم‌چنین بر اساس قانون زیف و الگوی آماری زو و همکاران (۲۰۰۶) که مشخص ساخت 
واژه‌های دارای بسامد بالا و توزیع ثابت در مدارکک مختلف به عنوان واژه‌های بازدارنده در نظر گرفته می- 
شونده پژوهش حاضر بر آن است که قابلیت به کار گیری دو روش مبتنی بر بسامد را در زبان فارسی مورد 
بررسی قرار دهد و بر این اساس واژه‌های بازدارنده موجود در متن و چکیده مقالات علمی- پژوهشی رشته 
کتابداری و اطلاع‌رسانی را شناسایی نماید. 


پرسش‌های پژوهش 

۱. واژه‌های بازدارنده موجود در متن مقاله‌ها جهت به کارگیری در نمایه‌سازی خود کار مدارکک 
فارسی رشته کتابداری و اطلاع‌رسانی بر اساس الگوی آماری زو کدام است؟ 

۲ واژه‌های بازدارنده موجود در چکیده مقاله‌ها جهت به کارگیری در نمایه‌سازی خود کار مدارکک 
فارسی رشته کتابداری و اطلاع‌رسانی بر اساس الگوی آماری زو کدام است؟ 

۳ واژه‌های بازدارنده موجود در متن مقاله‌ها جهت به کارگیری در نمایه‌سازی خود کار مدارکک 
فارسی رشته کتابداری و اطلاع‌رسانی بر اساس قانون زیف. کدام است؟ 

۴ واژه‌های بازدارنده موجود در چکیده مقاله‌ها جهت به کارگیری در نمایه‌سازی خود کار مدارکك 
فارسی رشته کتابداری و اطلاع‌رسانی بر اساس قانون زیف. کدام است؟ 

۵ تا چه حد بین سیاهه‌های واژه‌های بازدارنده به دست آمده از متن و چکیده در الگوی زو 
هم‌خوانی وجود دارد؟ 

۶ تا چه حد بین سیاهه‌های واژه‌های بازدارنده به دست آمده از متن و چکیده. در روش زیف 
هم‌خوانی وجود دارد؟ 

۷ تا چه حد بین سیاهه‌های واژه‌های بازدارنده به دست آمده از متن مقاله‌های دو روش زو و زیف 


هم‌خوانی وجود دارد؟ 


۱۳۱۵ 
۲ آنتروپی یکی از مقیاس‌های بنیادی در نظریه اطلاعات است که میزان وضعیت تصادفی بودن یک علامت (سیگنال) يا یکك 


اتفاق تصادفی را محاسبه می‌کند و با میزان اطلاعاتی که توسط یک علامت حمل می‌شود را نشان می‌دهد. 


۴ پژوهش‌نامه کتابداری و اطلاع‌رسانی» دانشگاه فردوسی مشهد سال ۳ شماره ۲ پائیز و زمستان ۱۳۹۲ 


۸ تا چه حد بین سیاهه‌های واژه‌های بازدارنده به دست آمده از چکیده مقاله‌های دو روش زو و 
زیف هم‌خوانی وجود دارد؟ 


٩‏ واژه‌های بازدارنده چه حجمی از متن و چکیده مقاله‌های حوزه مورد بررسی را تشکیل می‌دهند؟ 


از آن‌جا که واژه‌های بازدارنده نقش مهمی در بازیابی اطلاعات در پایگاه‌های اطلاعاتی دارند و 
حذف آن‌ها در نمایه‌سازی خود کار سبب سرعت بخشیدن به پردازش اطلاعات و در نتبجه صرفه‌جویی در 
زمان و فضای ذخیره‌سازی می‌شود. پژوهش‌های زیادی در سراسر جهان و در زبان‌های مختلف پیرامون 
این موضوع انجام شده است. 

فاکس" (۱۹۹۰) از اولین افرادی بود که فهرست واژه‌های بازدارنده را تهیه کرد. وی از روش 
بسامد استفاده کرد و پربسامدترین واژه‌های به دست آمده از پیکره زبانی براون" را با در نظر گرفتن نقطه 
برش بسامد» به عنوان واژه‌های بازدارنده عمومی در زبان انگلیسی پيشنهاد کرد. فهرست او شامل ۴۲۱ واژه 
بازدارنده بود که بعدها این فهرست در سیستم بازیابی او کاپی" مورد استفاده قرار گرفت. 

وی وه کی ۱۱۵۹۲ هآ ۷۱۳۱۱ کار و در ور هیک لو را 
بررسی قرار دادند و دریافتند که با حذف واژه‌های بازدارنده. حجم واژه‌های مدارکک حدود ۷۵ درصد 
کاهش می‌یابد. 

لازارینیس * (۲۰۰۷) مراحل ایجاد یک سیاه بازدارنده برای زبان بونانی و تأثیر حذف آن از 
پرسش‌های کاربران را مورد بررسی قرار داد و دریافت زمانی که واژه‌های بازدارنده از پرسش کاریران 
حذف شدند. جست‌وجو سریع‌تر انجام شد و تعداد صفحات مرتبط بیش‌تری بازیابی شد. 

در پژوهشی پاندی و سیدیکوئی" (۲۰۰۷) به ارزیابی تأثیر ریشه‌یابی و حذف کلمات بازدارنده بر 


بازیابی متون هندی پرداختند و به این نتیجه رسیدند که حذف کلمات بازدارنده به طور معنادار باعث 
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سال ۳ شماره ۲ پائیز و زستان ۱۳۹۲ کاربرد و تعدیل قانون زیف ... ۱۹۵ 


افزایش دقت بازیابی و کاهش حجم فایل نمایه شد. 
در پژوهشی دیگر هائو و هائو" (۲۰۰۸) یک رویکرد خودکار برای ایجاد فهرست واژه‌های 
بازدارنده در رده‌بندی متون چینی ارائه نمودند و هر واژه‌ای که دارای بسامد بالا در مدرک و همبستگی 
آماری کم با سایر طبقه‌های موجود در طرح رده‌بندی متون چینی بود. به عنوان واژه بازدارنده انتخاب 
نمودند. آن‌ها به این نتیجه رسیدند که سیاهه آن‌ها که در رده‌بندی نوشته‌های چینی موثر است و باعث 
افزایش دقت و کاهش زمان رده‌بندی می‌شود. 
در زبان فارسی سنجی (۱۳۸۷) پس از تعیین بسامد و نوع دستوری واژه‌های موجود در مقالات 
رشته‌های روانشناسی. علوم تربیتی و کتابداری و اطلاع‌رسانی؛ تعداد ۹۷۲۸۰ واژه (۱۲۹۱ واژه بدون 
احتساب بسامد) را به عنوان واژه‌های غیرمفهومی در سه رشته مورد مطالعه شناسایی نمود. هم‌چنین نشان 
داد که افعال قیود» ضمایر» حروف. اصوات. اعداد و علائم سجاوندی به عنوان واژه‌های نمایه‌ای ظاهر 
نمی‌شوند. 
در پژوهشی دیگر داورپناه» سنجی و آرمیده (۲۰۰۹) طی دو مرحله به بررسی ۶۳ مقاله در حوزه- 
های روان‌شناسیء علوم تربیتی و کتابداری و اطلاع‌رسانی و همچنین پیکره ایجاد شده به وسیله روزنامه 
همشهری پرداختند. در مرحله اول ۷۴۶ واژه و در مرحله دوم ۴۲۲ واژه را به عنوان واژه بازدارنده معرفی 
کردند. به طور کلی از مرور پیشینه پژوهش می‌توان دریافت که پژوهش‌های بسیاری در مورد واژه‌های 
بازدارنده (ساووی " 41۹۹۹ (ابوالخیر "۲۰۰۶)؛ بسامد (ادموندسون و وایلز ۱۹۵۹۵)؛ (برگ* ۰ ۱۹۹۷) و 
قانون زیف (فرانسیس و کوسرا" ۱۹۶۷)؛ (آراپوو و فیمووا و اشرایدر » 1۹۷۵) به ویژه در خارج کشور و 
پژوهش‌های کم‌تری در مورد زبان فارسی صورت گرفته است اما بر اساس بررسی‌های انجام شده پژوهشی 
مقایسه‌ای در مورد شناسایی واژه‌های بازدارنده مطابق با اگوی آماری زو و همکاران (۲۰۰۶) و قانون زیف 
یافت نشد. در بیش‌تر اين پژوهش‌ها از روش بسامد واژگانی استفاده شده است و اکثر فهرست‌های 
بازدارنده به دست آمده. کاربرد عمومی دارند و فقط تعداد انگشت شمار و محدودی از این فهرست‌ها در 
حوزه‌های خاص موضوعی و به صورت تخصصی تهیه شده‌اند. محققان در پژوهش‌های خود از پیکره‌های 
گوناگونی استفاده کرده‌اند. تعدادی از آن‌ها پیکره زبانی خود را از میان پایگاه‌های اطلاعاتی یا وب‌سایت- 
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۶ پژوهش‌نامه کتابداری و اطلاع‌رسانی» دانشگاه فردوسی مشهد سال ۳ شماره ۲ پائیز و زمستان ۱۳۹۲ 


ها انتخاب نموده‌اند و عده‌ای دیگر مجمو عه مدا رک چاپی (مقاله» روزنامه» چکیده و مانند آن) را مورد 
سنجش قرار داده‌اند. با توجه به این که تاکنون پژوهشی مقایسه‌ای در مورد شناسایی واژه‌های بازدارنده از 
نک غوشه واز کات مااسفاده از الگری خی معامده نقده اس ضرورت پر داغن بهایق ملرله اهشت 


می‌بابد. 


روش پژوهش 

این پژوهش از نظر هدف کاربردی و به روش تحلیل محتوا انجام گرفته است. جامعه آماری این 
پژوهش ۵۶ مقاله چاپ شده در آخرین شماره منتشر شده سال ۱۳۸۹ مجلات علمی- پژوهشی کتابداری و 
اطلاع‌رسانی می‌باشد که از بین آن‌ها ۲۰ مقاله با روش نمونه گیری تصادفی ساده انتخاب شدند. 


ابزار پژوهش 

۱. تهیه خوشه زبانی و متن الکترونیکی مقاله‌ها و چکیده‌های آن‌ها: در این مرحله تنها متن مقاله- 
ها بدون در نظر گرفتن پانویس‌هاء ارجاعات فرمول‌ها» جداول نمودارها؛ اعداد ریاضی و منابع و ماخذ در 
محیط نرم‌افزاری ۱۷00 تایپ شد تا شیوه تایپ آن‌ها یکدست شود (مانند جست‌وجو و جستجو). 

۲ تعدبل دستوری واژه‌ها (تفکیک وا ژگان): بخش‌های یک واژه مطابق با معیارهای مطرح شده در 
پژوهش سنجی (۱۳۸۷) مورد استفاده قرار گرفت. در اين معیارها دستورالعمل‌هایی در مورد صیغه‌ها و 
وجوه افعال» افعال مر کب» مصدرهای مرکب. اسامی مرکب» اسامی پیشوندی» میانوندی و پسوندی» 
گروه‌های حرف اضافه اسمی» قیدی و هم‌چنین تفکیک واژه‌ها از یکدیگر بر اساس فاصله بین آن‌ها ارائه 
گردیده است. 

۳ اجرای الگوی زو/ قانون زیف: 

الف) الگوی آماری زو: پس از تعیین بسامد تمام واژه‌های موجود در متن و چکیده مقالات مورد 
بررسی» مطابق فرمول؛ و آن‌ها محاسبه شد. به این صورت که بسامد واژه در یک متن/ چکیده بر کل 
تعداد واژه‌های همان متن / چکیده تقسیم شد. سپس با استفاده از دو نرم‌افزار 5۳55 و ۱113111۸13 برای هر 


واژه با توجه به فرمول‌های زیر» «میانگین احتمال ۱ «واریانس احتمال » و«ارزش آماری واژه با ضریب 


منناها۳:0 ۵۶ صهع]۱۷ .1 
منانمها۳۳:0 ۵۶ ممصمتته 2.۷ 


سال ۳ شماره ۲ پائیز و زمستان ۱۳۹۲ کاربرد و تعدیل قانون زیف ... ۱۹۷ 


تغییرات » در کلیه متن‌ها و چکیده‌های آن‌ها محاسبه شد: 


جدول ۱. فرمول‌های مربوط به الگوی زو 
میانگین احتمال واریانس احتمال ارزش آماری واژه 


2 ارطعرظ 
اس و ِِِ" - [ 7۱۷ ۳ <( ,)5۸7 
7 


آا[ عتعداد مدا رک است که در ِ_ 
میانگین ۲ های یکت واژه: 


این پژوهش ۲۰ مقاله می‌باشد. 


با بررسی ارزش آماری واژه‌های به دست آمده از این روش, نقطه برش در متن مقالات ۰ و در 
چکیده مقالات ۲۶۲ در نظر گرفته شد تا به این صورت بتوان تعداد واژه‌های غیرمفهومی بیش‌تری را در 
فهرست بازدارنده قرار داد. هر واژه‌ای از متن یا چکیده که ارزش آماری آن کم‌تر از این دو نقطه برش 
بود» به عنوان واژه بازدارنده انتخاب شد. 


ب) قانون زیف: بر این اساس» واژه‌ها به ترتیب بسامد از زیاد به کم مرتب شدند. بالاترین بسامد واژه- 
77۳7+ 1- 


های موجود در هر مقاله تعیین شد و بر اساس این فرمول نقطه عطف آن مقاله مشخص شد: 
- 7 (هویدا ۱۳۷۸). 

:: بالاترین بسامد واژه‌های موجود در یک مقاله است که در طبقه اول جدول زیف قرار گرفته است 
به این ترتیب در پژوهش حاضر برای هر متن و چکیده مقاله یک نقطه عطف تعیین شد و کلماتی از آن‌ها 
که بسامدی بالاتر از اين نقاط عطف داشتند» به عنوان بازدارنده استخراج شدند و در یک فهرست قرار 
گرفتند و واژه‌های بازدارنده تکراری حذف شدند. 

۴ تعدیل محتوایی و توجه به معنادار بودن يا غیرمعنادار بودن واژه‌ها: در شیوه اول با قبل از 
تعدیل. واژه‌های بازدارنده بر اساس ارزش آستانه‌ای یا نقاط عطف تعبین شده استخراج شدند. اما در شیوه 
دوم یا بعد از تعدیل, ابتدا فهرست واژه‌های بازدارنده استخراج شده (قبل از تعدیل) مورد بازیینی قرار 
گرفت و واژه‌های معنادار آن‌ها حذف شد و سپس تعدادی از واژه‌های غیرمفهومی که در فهرست نیامده 
بودند» به فهرست اضافه شدند. پژوهش بر اساس قواعد ارائه شده آماری که کاربرد غیر قابل انکاری در 


شناسایی واژگان غیرمفهومی دارند و هم‌چنین بر اساس قاعده و نظریه زیف در مورد اصل کمترین کوشش 


(5۸۲) 0۶۱/۵۲۵4 میاه ۷ اهعناعتاهاه .1 


۸ پژوهش‌نامه کتابداری و اطلاع‌رسانی» دانشگاه فردوسی مشهد سال ۳ شماره ۲ پائیز و زمستان ۱۳۹۲ 


که پژوهش‌های بسیار زیادی پیرامون آن انجام پذیرفته. بنا شده است. هم‌چنین برای غنا بخشیدن به این 
یافته‌ها در زبان فارسی سعی گردید از معیارهای مطرح شده در پژوهش سنجی به عنوان مبنایی برای 
شناسایی واژه‌های مفهومی و غیرمفهومی و تشخیص و جداسازی واژه‌های بازدارنده از غیر بازدارنده 
استفاده شود. به این صورت که پس از تعیین نوع دستوری واژه‌های استخراج شدهء اگر واژه‌ای جزء یکین 
از گروه‌های دستوری مورد اشاره در پژوهش ایشان (افعال قیود. ضمایر و...) بود به عنوان بازدارنده و در 


غیر این صورت به صورت واژه مفهومی در نظر گرفته شد. 


یافته‌های پژوهش 
در مورد هر فهرست. فقط ۱۰ واژه بازدارنده ابتدای فهرست‌های به دست آمده ارائه شده و 
فهرست‌های کامل از طریق ارتباط با پژوهشگر قابل دسترس است . لازم به ذ کر است که علائم سجاوندی 
نیز در این پژوهش مورد پردازش قرار گرفته‌اند اما از جداول حذف گردیده است. 
۱. واژه‌های بازدارنده موجود در متن مقاله‌ها جهت به کارگیری در نمایه‌سازی خود کار مدارکک 


فارسی رشته کتابداری و اطلاع‌رسانی بر اساس الگوی آماری زو » کدام است؟ 


جدول ۲. فهرست واژه‌های بازدارنده متن مقاله‌ها بر اساس الگوی زو «قبل و بعد از تعدیل» 


دیش واژه قبل از تعدیل | بعد از تعدیل میانگین احتمال واریانس احتمال ارزش آماری 
۱ آشکال ۳۹ ۳ ۵ ۱۳۶( ۳۳۳5۹ ۹۵۳ 
۲ ابتدا ۷ ۳ ۱۷ مه ۱۴ 
۳ ابزار ۷ ِ ۵۶۵ ۳۹۴ مییه.   ]‏ ۱۵۳ 
۴ ابعاد ۳ ِ ۲۹ 5.۲ ۲۴۳۴۳۲ 
۵ اثر ۳ ۳ ۵ ۳۳۹ و ۱۳۶۷ 
۶ احتمالا "۷ ۳ ۵ ۱۶۳۱۵۸ ۳ ۱۵۵۷ 
۷ ارائه ۷" ۷ ۴۵ ۹ ۱۴۳۹۹۸ 
۸ ارائه شده ۷ ۷ 0 ۵۵۹ ی ۱۱۸۰۳ 
۹ ارتباط ۷ ِ ۵ ۳۶ دی ۱۰۳۸ 
۱ اثررگذار " 4 ۳ ۴۳۱۷۹ موی ۲۱۸۹۸ 
۱۳۶۸ ۴۶۸ 
جمع 


. در صورت لزوم با آدرس ایمیل پژوهشگر مکاتبه شود. 


سال ۳ شماره ۲ پائیز و زستان ۱۳۹۲ کاربرد و تعدیل قانون زیف ... 1۹۹ 


نتایج جدول ۲ نشان می‌دهد که واژه‌های موجود در متن مقالات پس از اعمال الگوی زو تبدیل 
به ۳۳۶۸ واژه شدند که از بین آن‌ها قبل از تعدیل واژه‌ها» ۱۳۶۸ واژه و بعد از تعدیل آن‌هاه ۴۳۶۸ واژه به 


عنوان واژه بازدارنده استخراج شدند که در جدول فقط ۰واژه اول ارائه شده است. 


۲ _ واژه‌های بازدارنده موجود در چکیده مقاله‌ها جهت به کارگیری در نمایه‌سازی خود کار مدارکك 


فارسی رشته کتابداری و اطلاع‌رسانی بر اساس الگوی زو کدام است؟ 


جدول ۳. فهرست واژه‌های بازدارنده چکیده مقاله‌ها بر اساس الگوی زو «قبل و بعد از تعدیل» 


ردیف واژه قبل از تعدیل بعد از تعدیل میانگین احتمال واریانس احتمال ارزش آماری واژه 
۱ است ۷ ۷ ۵۵ ۳۷ 2۴" 
۲ استفاده ۷ ۳ ۸ ۸ ۱۳۶,۱۳ 
۳ استفاده شد ۷ ِِ ۳۵ ۶۴۱ مه ۱۶۴۹۲ 
۴ افزایش ۷ ۳ ۵ ۶/۷ و ۱۶۲,۰۱ 
۵ اطلاعاتی ۷ حِ ۸۸ ۹ ۱۷۳۸۵۹ 
۶ ارائه ۷ 7 ۳۲ ۳۳ ۱۲۱۷۱ 
۷ ارائه شده ۷ ۷ ۲ ۳ 2 
۸ از 7 ۷ ۱۳۷ ۸ ۵۳,۳۵ 
۹ از نظر ۷ ۷ ۳« ۳ ۱۹۲۷۵ 
۱ این ۷ ۳ ۴ ۲ ۶۶۴ 
جمع ۱۴۳/۸ ۱۷۳ 


نتایج جدول ۳ نشان می‌دهد که واژه‌های موجود در چکیده مقالات پس از اعمال الگوی زو تبدیل 
به ۳ واژه شدند که از میان آن‌ها قبل از تعدیل» ۱۴۸ واژه و بعد از تعدیل» ۱۷۳ واژه به عنوان بازدارنده 


۴._ واژه‌های بازدارنده موجود در متن مقاله‌ها جهت به کار گیری در نمایه‌سازی خود کار مدارکک 


۰ پژوهش‌نامه کتابداری و اطلاع‌رسانی» دانشگاه فردوسی مشهد سال ۳ شماره ۲ پائیز و زمستان ۱۳۹۲ 


جدول ۴۳. فهرست واژه‌های بازدارنده متن مقاله‌ها بر اساس الگوی ز یف«قبل و بعد از تعدیل» 


قبل از تعدیل بعد از تعدیل 
۱ ۱ تعداد مقالاتی که عامل ۱ تعداد مقالاتی که این 
ردیف واژه بسامد واژه بسامد 
انتخاب واژه بوده‌اند واژه را در بر دارند 
۱ اپرداده ۲۹ ۱ احتمالاً ۳ ۳ 
۲ اتخاذ ۲۹ ۱ اساسا ۱ ۱ 
۳ اثر ۲۱ ۱ ایشان ۲ ۱ 
۴ اختلاف ۲۳ ۱ اینجا ۸ ۵ 
۵ ارائه ۴ ۱ اینکگ ۱ ۱ 
۶ ارتباطات ۳۰ ۱ اغلب ۲۱ ۱۱ 
۷ از ۱۵۳۷ ۲ 7 ۱2۳۷ ۲ 
۸ استناد ۱ ۱ افزون بر این ۳ ۱ 
۹ است ۵۷۵ ۱۴ ۷ ۶۵۷ ۲ 
۱ استاندارد ۲۶ ۱ اکثر ۲ ۲ 


نتایج جدول ۴ نشان‌دهنده آن است که از بین ۱۵۵۵۷ واژه مورد مطالعه» مطابق قانون زیف و قبل از 
تعدیل» ۳۷ واژه و بعد از تعدیل» ۷< واژه به عنوان واژه بازدارنده شناخته شدند. 
۴ واژه‌های بازدارنده موجود در چکیده مقاله‌ها جهت به کارگیری در نمایه‌سازی خود کار مدارکك 


جدول ۵. فهرست واژه‌های بازدارنده موجود در چکیده‌ها بر اساس قانون زیف «قبل و بعد از تعدیل» 


قبل از تعدیل بعد از تعدیل 
عداد مقالائی که عامل انتخاب واه تعداد متالاتی که این واژه را 
ردیت وژه بسامد وژه سامد 
بوده‌اند در بر داروند 
1 اثر ۴ ۱ لرائه ۶ ۴ 
۷ ۷۳ رن ۸۷ ۱/۸ 
۴ استفاده ۱۲ ۴ ازاین‌ر و ۱ ۱ 


۷ این ۳۸ ۶ ۷" ۶ 1۵ 
۸ آن ۱۲ ل ای نگونه ۱ ۱ 
۹ بعد ۵ ۱ این که ۲ ۲ 


سال ۳ شماره ۰۲ پائیز و زمستان ۱۳۹۲ کاربرد و تعدیل قانون زیف .۰ ۲۰۱ 


همان گونه که در جدول ۵ مشاهده می‌شود از میان ۱۹۸۹ واژه موجود در چکیده‌های مورد مطالعه 
قبل از تعدیل ۶۰ واژه و بعد از تعدیل» ۱۸۶ واژه به عنوان واژه بازدارنده شناسایی شدند. 
۵ تا چه حد بین سیاهه‌های واژه‌های بازدارنده به دست آمده از متن و چکیده. در روش زو هم‌خوانی 
وجود دارد؟ 
قبل از تعدیل, از بين ۱۳۷۵ واژه مورد مقایسه۱۴۱ واژه (۱۰/۲۵ درصد) و بعد از تعدیل از بین ۴۸۸ 
واژه مورد مقایسه» ۱۵۳ واژه (۳۱/۳۵درصد) بین دو فهرست حاصل از متن و چکیده با هم مشت رک هستند. 
۶ تا چه حد بین سیاهه‌های واژه‌های بازدارنده به دست آمده از متن و چکیده. در روش زیف 
هم‌خوانی وجود دارد؟ 
از بین ۲۱۸ واژه مورد مقایسه قبل از تعدیل» ۵٩‏ واژه بازدارنده مشت رک (۲۷/۰۶ درصد) بین دو فهرست 
مورد اشاره یافت شد. از ۶۱۳ واژه مورد مقایسه پس از تعدیل واژه‌هاء ۱۸۰ واژه بازدارنده (۲۹/۳۶ درصد) 
بین دو فهرست مشترک بودند. 
۷ تا چه حد بین سیاهه‌های واژه‌های بازدارنده به دست آمده از متن مقاله‌های دو روش زو و زیف 
هم‌خوانی وجود دارد؟ 
قبل از تعدیل, از مجموع ۱۴۵۶ واژه مورد مقایسه ۱۲۹ واژه بازدارنده (۰۸/۸۵ درصد) و پس از تعدیل 
واژه‌ها نیز از میان ۶۶۴ واژه مورد مقایسه» ۴۱۱ واژه (۶۱/۸۹ درصد) بین دو فهرست مشتر کک بودند. 
۸ تا چه حد بین سیاهه‌های واژه‌های بازدارنده به دست آمده از چکیده مقاله‌های دو روش زو و زیف 
هم‌خوانی وجود دارد؟ 
قبل از تعدیل» ۱۶/۲۰ درصد (یعنی ۲۹ واژه از ۱۷۹ واژه مورد مقایسه) از واژه‌های بازدارنده و پس از 


تعدیل نیزه ۸۳/۱۶ درصد (یعنی ۱۶۳ واژه از ۱۹۶ واژه مورد مقایسه) بین این دو فهرست مشت رک بودند. 


۲ پژوهش نامه کتابداری و اطلاع‌رسانی دانشگاه فردوسی مشهد 


سال ۳ شماره ۲ پائیز و زمستان ۱۳۹۲ 


جدول ۶. فهرست واژه‌های بازدارنده مشتر ک بین فهرست‌های مورد بررسی به تفکیک قبل و بعد از تعدیل 


۰ واژه بازدارنده مشتر کث بین عتن و 


بعد از تعدیل 
ارائه 
از 


از نظر 


از آن جا که 


از طریق 


۲۰وازه بازدارنده مشتر کك بین متن 


و چکیده زیف 


قیل از تعدیل 


استاندارد 


استفاده 


۲ واژه بازدارنده مشتر کك بین 


متن‌های دو روش زو و زیف 


قیل از 


بعد از تعدیل 


۰ وازه بازدارنده مشت ر کك 
بین چکیده‌های دو 


روش زو و ژزیف 


٩‏ واژه‌های بازدارنده چه حجمی از متن و چکیده مقاله‌های حوزه مورد پررسی را تشکیل می‌دهند؟ 
به منظور پاسخگویی به این سوال نسبت تعداد واژه‌های بازدارنده متن یا چکیده به تعداد کل واژه‌های 


متن / چکیده به تفکیک الگوی زو و قانون زیف مورد محاسبه قرار گرفت. نتایج بررسی در جدول‌های ۷و 


۸ بیان شده است. 


جدول ۷. حجم واژه‌های بازذارنده در متن و چکیده مقالات بر اساس الگوی زو 


تعداد کل واژه‌های 
نام شیوه متن بدون احتاب 


الگوی زو 


پسامد 


تعداد واژه‌های متن بعد 


از اعمال الگوی زو 


تعداد واژه‌های 


بازدارنده 


درصد واژه‌های 
باژدارنده بعد از اعمال 


الگوی زو 


درصد واژه‌های بازدارنده نست 
به تعداد کل واژه‌های متن بدون 


احتاتب اند 


۳۳ 
قبل از تعدیل ۱۵۵۵۷ 

تن مقالات 
وت تن بعد از تحدیل ۱۵۵۵۷ 
قبل از تعدیل ۱۹۸۹ 
مقالات بعد از تعدیل ۱۹۸۹ 


۳۳۶۸ 


۳۴۶۸ 


۳ 


1۳ 


۱۳۶۸ 


۳۹/۴۴ 


۱۳/۴۹ 


اف 


۱۸3۳/۹۴ 


۹ 


سال ۳ شماره ۰۲ پائیز و زمستان ۱۳۹۲ 


کاربرد و تعدیل قانون زیف .. ۲۰۳ 


یافته‌های جدول ۷ نشان‌دهنده این است که در الگوی زو بالاترین سبت واژه‌های بازدارنده قبل از 


تعدیل واژه‌هاه مربوط به متن مقالات (۳۹/۴۴ درصد) و پس از تعدیل مربوط به چکیده مقالات (۱۸/۹۴ 


درصد) می‌باشد. 
نام شیوه 
فرمول زیف 
قبل از 
تعدیل 
متن مقالات 
بعد از 
تعدیل 
قبل از 
تعد 
بت ۳ 
مقالات 
بعد از 
تعدیل 
یافته‌های جدو 


پس از تعدیل (۴۳/۹۷ درصد) بالاترین نسبت واژه‌های بازدارنده را دارا است. 


جدول ۸. حجم واژه‌های بازدارنده در متن و چکیده مقالات بر اساس فرمول ز یف 


نتیجه گیری 
در متن مقالات مطابق الگوی زو تعداد واژه‌های بازدارنده قبل از تعدیل» ۶۵/۷۹ درصد بیش‌تر از 


بدون احتساب بسامد 


تعداد کل 


واژه‌های متن 
بدون احتساب 


پسامد 


۱۱۵۵۷ 


۱۱۵۷ 


۱۹۸۹ 


۱۹۸۹ 


تعداد واژه- 
های بازدارنده 
بدون احتساب 


بسامد 


۳۷ 
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۱۸۶ 


درصد واژه- 
های بازدارنده 
بدون احتساب 


پسامد 


"۱/۳۹ 


۰۳/۹ 


۰۹/۳۵ 


تعداد کل 
واژه‌های متن 
با احتساب 


پسامد 


۷/۳۷/۵۰ 


۷/۳۷/۵۰ 


۳۸۳۰ 


با احتساب بسامد 
تعداد واژه- درصد واژه- 
های بازدارنده | های بازدارنده 
با احتساب با احتساب 
پسامد 9 
۱۳۷ ۳۸/۰ 
شففض ۳۳/۹۷ 
۱۳۷ ۳۹/۷۶ 
۱۶۲۵ ۳/۳۳ 


ل ۸ نشان می‌دهد که در روش زیف. متن مقالات قبل از تعدیل (۴۸/۱۰ درصد) و 


بعد از تعدیل می‌باشد. به نظر می‌ رسد این تفاوت در تعداد واژه‌های بازدارنده ناشی از وجود تعداد قابل 


توجهی از واژه‌های معنادار در فهرست بازدارنده‌ای باشد که در شیوه قبل از تعدیل ایجاد شده است. به 


نحوی که با حذف این واژه‌ها در شیوه بعد از تعدیل» تعداد واژه‌ها در دومین فهرست کاهش یافت. نتایج 


این پژوهش تا اندازه زیادی با یافته‌های پژوهش سنجی (۱۳۸۷)؛ فاکس (۱۹۹۰)؛ هائو و هائو (۲۰۰۸)؛ 


۴ پژوهش‌نامه کتابداری و اطلاع‌رسانی» دانشگاه فردوسی مشهد سال ۳ شماره ۲ پائیز و زمستان ۱۳۹۲ 


داورپنام سنجی و آرمیده (۲۰۰۹) مطابقت دارد. سنجی. ۱۲۹۱ واژه بازدارنده را بر اساس نوع دستوری 
واژه‌ها و با در نظر گرفتن بسامد آن‌ها شناسایی نمود. فاکس (۱۹۹۰)؛ هائو و هائو (۲۰۰۸) و داورپناه. 
سنجی و آرمیده (۲۰۰۹) نیز در پژوهش‌های خویش به ترتیب ۵۰۰۰۴۲۱ و ۴۲۲ واژه بازدارنده را استخراج 
نمودند. به نظر می‌رسد تفاوت بین تعداد واژه‌های بازدارنده این پژوهش و ساير پژوهش‌های مورد بررسی 
به دلیل تفاوت در روش مورد استفاده جهت استخراج واژه‌های غیرمفهومی» تفاوت در جامعه آماری مورد 
مطالعه با اختلاف بین پژوهشگران در تعریف واژه و تعیین مرز کلمات که یکک مرحله اجتناب‌ناپذیر قبل از 
شناسایی واژه‌های بازدارنده است و یا تفاوت در نقطه برش تعیین شده باشد. این نقطه برش بر اساس 
استنباط فردی پژوهشگر و بررسی پیکره مورد مطالعه مشخص می‌شود. با توجه به این که در الگوی زو بر 
اساس محاسبات آماری» ارزش بسامد واژه در کل خوشه زبانی مورد توجه قرار می‌گیرد» می‌توان از این 
الگو به نحو شایسته‌تری در بانک‌های اطلاعاتی تخصصی و مجموعه متون هم‌بند و هم‌سنخ استفاده نمود 
زیرا بسیاری از واژه‌های عام و بی‌ارزش محتوایی و اطلاعاتی را در مجموعه‌های بز رگ شناسایی نموده و 
باعث بهینه‌سازی ذخیره و بازیابی اطلاعات تخصصی می‌شود و به نمایه‌سازان چکیده‌نویسان و طراحان 
پایگاه‌ها و نرم‌افزارهای اطلاعاتی در کاهش میزان حجم فایل مقلوب نمایه زمان و هزینه ذخیره‌سازی و 
بازیایی اطلاعات کمک می‌نماید. 

در چکیده مقالات نیز طبق الگوی زو تعداد واژه‌های بازدارنده بعد از تعدیل ۱۴/۴۵ درصد 
افزایش یافت. به نظر می‌رسد این تفاوت در تعداد واژه‌های بازدارنده می‌تواند مربوط به نقطه برش تعیین 
شده برای چکیده مقالات باشد که بر اساس آن برخی از واژه‌های غیرمفهومی به دلیل این که ارزش 
آماری بالایی داشتند. در بخش واژه‌های معنادار قرار گرفتند و با اجرای شیوه بعد از تعدیل و اضافه نمودن 
آن‌ها به فهرست. تعداد واژه‌های بازدارنده در دومین فهرست افزایش یافت. تنها پژوهشی که به بررسی 
چکیده مقالات به منظور شناسایی واژه‌های بازدارنده پرداخته بود» پژوهش ساووی (1۹۹۹) بود که در 
پژوهش خود. ۲۱۵ واژه بازدارنده را از متن و چکیده مقالات استخراج نمود. 

بنا بر قانون زیف نیز در متن مقالات قبل از تعدیل» ۲۱۷ واژه (با احتساب بسامد ۳۵۴۷۷ واژه) و بعد 
از تعدیل, ۶۰۷ واژه (با احتساب بسامد ۳۲۴۲۸ واژه) به عنوان واژه بازدارنده شناخته شدند. همان گونه که 
مشاهده می‌شود بدون احتساب بسامد. تعداد واژه‌های بازدارنده در شیوه بعد از تعدیل که به مفهوم معنایی 
کلمات و تعدیل واژه‌ها توجه شده. ۳برابر شده است اما با احتساب بسامد. تعداد واژه‌های بازدارنده شیوه 


قبل از تعدیل بیش‌تر است. قانون زیف فقط بسامد واژه‌ها را در نظر می‌گیرد و واژه‌هایی که زیاد تکرار 


سال ۳ شماره ۰۲ پائیز و زمستان ۱۳۹۲ کاربرد و تعدیل قانون زیف ... ۲۰۵ 


شده باشند را به فهرست اضافه می‌نماید که البته تعدادی از آن‌ها معنادار بوده و به همین دلیل در شیوه بعد 
از تعدیل از فهرست واژه‌های بازدارنده حذف شدند؛ در مقابل واژه‌های غیرمعناداری هم که به فهرست 
شیوه بعد از تعدیل اضافه شدند از بسامد بالایی برخوردار نبودند. یافته‌ها با نتیجه پژوهش داوریناه و بلندیان 
(۱۳۸۵) مطابقت داشت. آن‌ها به اين نتیجه رسیدند که واژه‌های بازدارنده بالاترین بسامد را به خود 
اختصاص داده‌اند که با حذف آن‌ها از حجم مدا رکت به میزان قابل توجهی کاسته می‌شود. 

در چکیده مقالات نیز مطابق قانون زیف. قبل از تعدیل ۶۰ واژه (با احتساب بسامد آن‌هاء ۱۱۳۷ 
واژه) و بعد از تعدیل ۱۸۶ واژه (با احتساب بسامد آن‌هاء ۱۶۲۵ واژه) به عنوان واژه بازدارنده شناخته شدند 
که با اجرای شیوه بعد از تعدیل» ۷۴/۸۴ درصد افزایش داشته است. تعداد کم واژه‌های بازدارنده استخراج 
شده از چکیده مقالات نشان می‌دهد که در سال‌های اخیر پژوهشگران در نگارش چکیده‌های خود دقت 
بیش‌تری می کنند و چکیده‌ها نیز بار اطلاعاتی افزون‌تری را منتقل کرده و بیشتر حاوی واژه‌های مفهومی 
ماگ 

الگوی زو یکی از الگوهای آماری است که برای شناسایی واژه‌های بازدارنده مورد استفاده قرار 
گرفته است و بر اساس بسامد عمل می کند و ارتباط آن با قانون زیف نیز این است که هر دو مبتنی بر 
بسامد هستند. در این پژوهش این مسئله مدنظر قرار گرفت و سعی شد قابلیت به کارگیری آن‌ها در زبان 
فارسی و تفاوت آن‌ها در ایجاد فهرست واژه‌های بازدارنده مورد بررسی قرار گیرد که به طور کلی به نظر 
می‌رسد که می‌توان در زبان فارسی از الگوی آماری زو و هم‌چنین قانون زیف برای شناسایی واژه‌های 
بازدارنده موجود در متن و چکیده مقالات استفاده نمود که هر کدام از این دو الگو نکات قوت خاص 
خود را داراست. البته تشخیص کاربردپذیری و میزان کارایی این فهرست‌ها نیازمند به کارگیری آنان در 
شرایط عملیاتی تجربی و آزمایشی در حیطه ذخیره و بازیابی متون اطلاعاتی در شاخه‌های موضوعی 
مختلف می‌باشد. 

تعداد واژه‌های بازدارنده موجود در متن بیشتر از چکیده می‌باشد زیرا از یک سوه متن از حجم 
واژگانی بیشتری نسبت به چکیده برخوردار است و از سوی دیگر» چکیده معمولاً غنی‌تر از متن است و 
بیشتر حاوی واژه‌های مفهومی می‌باشد. لذا استنباط می‌شود که طول متن در حجم واژه‌های بازدارنده تأثیر 
دارد. 

در هر دو روش رابطه مستقیمی بین بسامد واژه‌ها (در متن و چکیده) و احتمال بازدارنده بودن آن‌ها 


یافت شد. هم‌چنین عامل تعدیل که در اين پژوهش مورد استفاده قرار گرفت نقش بسزایی در شناسایی 
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واژه‌های بازدارنده داشت که در آن» حذف بعضی از واژه‌ها و اضافه نمودن برحی فیگرش اسانن قضاوت 
پژوهشگر انجام گرفته و نیاز به آگاهی و مهارت وی در مسائل زبان مورد مطالعه دارد. اما در مقایسه با 
شیوه قبل از تعدیل برای استخراج واژه‌های بازدارنده زمان و هزینه‌های بیشتری را می‌طلبد. در کلیه 
فهرست‌های به دست آمده از پژوهش میزان هم‌خوانی با اجرای شیوه دوم افزایش يافته است. در این شیوه 
عامل انسانی دخالت داشته و از معیارهای مشابهی برای تمایز واژه‌های معنادار و غیرمعنادار استفاده شده 
است. در نتیجه تعداد واژه‌های مشترکک بین فهرست‌های مورد بررسی بیشتر است. در مجموع به قصد 
مقایسه و کاربرد این دو روش در استخراج واژه های بازدارنده اين پژوهش انجام شد و با استفاده از دو 
روش مذ کور ۸ فهرست از واژه‌های بازدارنده موجود در متن و چکیده مقالات تهیه شد و میزان هم‌خوانی 
بين آن‌ها به تفکیک دو شیوه مورد مطالعه قرار گرفت که یافته‌ها نشان داد واژه‌های موجود در این 
فهرست‌ها تا حد زیادی متشابه نبوده و میزان هم‌خوانی بين این فهرست‌ها در سطح پایینی است. این امر 
نشان‌دهنده آن است که ایجاد فهرست واژه‌های بازدارنده منسجم و واحدء حتی برای یک حیطه موضوعی 
خاص کاری بس مشکل و تقریباً ناممکن است و نمی‌توان به سادگی به آن دست یافت و به همین دلیل 
پژوهشگران از روش‌های گونا گونی در این زمینه استفاده کرده‌اند. 
بدون احتساب بسامد متن مقالات در روش زو (۳۹/۴۴ درصد) و با احتساب بسامد» متن مقالات در 
روش زیف (۴۸/۱۰ درصد) دارای بیشترین نسبت واژه‌های غیرمفهومی می‌باشند. با بررسی فهرست به 
دست آمده از طریق قانون زیف مشخص شد که استفاده از این قانون به عنوان مبنایی برای تعیین کلمات 
معنادار در یک مدرک مناسب‌تر باشد و یا برای تهیه فهرست واژه‌های بازدارنده در یک مجموعه و پیکره 
عمومی کاربرد مناسب‌تری داشته باشد که در نهایت» بررسی‌های بیشتر به منظور روشن‌تر شدن ابعاد 
مختلف یافته‌های این پژوهش از جنبه‌های مختلف نظری و کاربردی» ضروری به نظر می‌رسد. 
با توجه به نتایج به دست آمده پیشنهادهای اجرایی زیر موثر به نظر می‌رسد: 
_ با توجه به شیوه خاص نگارش زبان فارسی (فاصله بین کلمات. املای متفاوت واژه‌ها و غیره) که 
مشکلاتی را در تفکیک واژه‌ها به وجود می آورند» پيشنهاد می‌شود دستنامه واحد و استانداردی 
برای تایپ فارسی و ورود اطلاعات به رایانه مدون گردد تا کلمات به روشنی قابل تفکیک و 


۲ از آن جایی که نشریات علمی و پژوهشی دارای بیشترین میزان کاربرد در عملیات ذخیره و 


بازیابی اطلاعات می‌باشند» تهیه شیوه‌نامه‌ای استاندارد در طول نگارش این متون می‌تواند برای 
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درونداد اطلاعات در پایگاه‌های اطلاعاتی و پژوهش‌هایی از اين دست که با تحلیل واژگان 
سرو کار دارند» مفید باشد. 

۳ پیشنهاد می‌شود که هنگام ورود اطلاعات متنی به رایانه در به کار گیری و استفاده از نیم‌فاصله 
دقت کافی انجام پذیرد به ویژه در مورد نام کامل نویسند گان, افعال و علائم جمع و تکواژهای 
صرفی و سایر واژه‌هایی که به لحاظ مفهومی قابل تفکیک نمی‌باشند و در همین راستا با توجه به 
کاربرد متوالی نیم فاصله در تایپ فارسی به طراحان سخت‌افزار پيشنهاد می‌شود صفحه کلید 
تایپ فارسی را به گونه‌ای باز طراحی نمایند که کلیدی جداگانه و سهل‌الوصول برای نیم‌فاصله 
جروت میرآنیم کردم 

۴_ به طراحان پایگاه‌های اطلاعاتی پيشنهاد می‌شود که با شناسایی واژه‌های بازدارنده و ذخیره آن‌ها 
در پایگاه خود میزان کارایی در ذخیره و بازیابی مدارک را افزایش دهند. 

۵ پيشنهاد می‌شود در نرم‌افزارهای کتابخانه‌ای و ذخیره و بازیابی اطلاعات. بانک واژه‌های 
بازدارنده تعبیه شود تا ضمن کاهش مدت زمان و هزینه نمایه‌سازی» مدارکک مرتبط بیشتری 
بازیابی شود. 

۶ پیشنهاد می‌شود فهرست‌های به دست آمده از این پژوهش در خوشه‌های واژگانی مختلف عملا 
به کار گرفته شود و میزان تأثیر آن در عملیات ذخیره و بازیابی اطلاعات از جمله ضریب دقت و 


بازیافت» صرفه‌جویی در زمان هزینه و مانند آن مورد بررسی قرار گیرد. 
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